جلد سخت سیاه و سفید
Product details
- Publisher : Packt Publishing (January 21, 2022)
- Language : English
- Paperback : 602 pages
- ISBN-10 : 1801072132
- ISBN-13 : 978-1801072137
کتاب Hands-On Data Preprocessing in Python: Learn how to effectively prepare data for successful data analytics
Get your raw data cleaned up and ready for processing to design better data analytic solutions
Key Features
- Develop the skills to perform data cleaning, data integration, data reduction, and data transformation
- Make the most of your raw data with powerful data transformation and massaging techniques
- Perform thorough data cleaning, including dealing with missing values and outliers
Book Description
Hands-On Data Preprocessing is a primer on the best data cleaning and preprocessing techniques, written by an expert who's developed college-level courses on data preprocessing and related subjects.
With this book, you'll be equipped with the optimum data preprocessing techniques from multiple perspectives, ensuring that you get the best possible insights from your data.
You'll learn about different technical and analytical aspects of data preprocessing – data collection, data cleaning, data integration, data reduction, and data transformation – and get to grips with implementing them using the open source Python programming environment.
The hands-on examples and easy-to-follow chapters will help you gain a comprehensive articulation of data preprocessing, its whys and hows, and identify opportunities where data analytics could lead to more effective decision making. As you progress through the chapters, you'll also understand the role of data management systems and technologies for effective analytics and how to use APIs to pull data.
By the end of this Python data preprocessing book, you'll be able to use Python to read, manipulate, and analyze data; perform data cleaning, integration, reduction, and transformation techniques, and handle outliers or missing values to effectively prepare data for analytic tools.
What you will learn
- Use Python to perform analytics functions on your data
- Understand the role of databases and how to effectively pull data from databases
- Perform data preprocessing steps defined by your analytics goals
- Recognize and resolve data integration challenges
- Identify the need for data reduction and execute it
- Detect opportunities to improve analytics with data transformation
Who this book is for
This book is for junior and senior data analysts, business intelligence professionals, engineering undergraduates, and data enthusiasts looking to perform preprocessing and data cleaning on large amounts of data. You don't need any prior experience with data preprocessing to get started with this book. However, basic programming skills, such as working with variables, conditionals, and loops, along with beginner-level knowledge of Python and simple analytics experience, are a prerequisite.
Table of Contents
- Review of the Core Modules of NumPy and Pandas
- Review of Another Core Module - Matplotlib
- Data – What Is It Really?
- Databases
- Data Visualization
- Prediction
- Classification
- Clustering Analysis
- Data Cleaning Level I - Cleaning Up the Table
- Data Cleaning Level II - Unpacking, Restructuring, and Reformulating the Table
- Data Cleaning Level III- Missing Values, Outliers, and Errors
- Data Fusion and Data Integration
- Data Reduction
- Data Transformation and Massaging
- Case Study 1 - Mental Health in Tech
- Case Study 2 - Predicting COVID-19 Hospitalizations
- Case Study 3: United States Counties Clustering Analysis
- Summary, Practice Case Studies, and Conclusions
منابع کتاب کتاب Hands-On Data Preprocessing in Python: Learn how to effectively prepare data for successful data analytics
برای طراحی راه حل های تحلیلی داده های بهتر، داده های خام خود را تمیز و آماده پردازش کنید
ویژگی های کلیدی
- مهارت های انجام پاکسازی داده ها، یکپارچه سازی داده ها، کاهش داده ها و تبدیل داده ها را توسعه دهید
- با تکنیک های قدرتمند تبدیل داده و ماساژ، از داده های خام خود نهایت استفاده را ببرید
- پاکسازی کامل داده ها را انجام دهید، از جمله برخورد با مقادیر از دست رفته و نقاط پرت
توضیحات کتاب
Hands-On Data Preprocessing آغازگر بهترین تکنیک های پاکسازی و پیش پردازش داده است که توسط متخصصی که دوره های آموزشی در سطح کالج را در زمینه پیش پردازش داده ها و موضوعات مرتبط ایجاد کرده است، نوشته شده است.
با استفاده از این کتاب، شما به تکنیکهای بهینه پیشپردازش دادهها از منظرهای مختلف مجهز خواهید شد، و اطمینان حاصل میکند که بهترین بینش ممکن را از دادههای خود دریافت میکنید.
شما در مورد جنبه های مختلف فنی و تحلیلی پیش پردازش داده ها - جمع آوری داده ها، تمیز کردن داده ها، یکپارچه سازی داده ها، کاهش داده ها و تبدیل داده ها - خواهید آموخت و با اجرای آنها با استفاده از محیط برنامه نویسی منبع باز Python آشنا خواهید شد.
مثالهای عملی و فصلهای ساده به شما کمک میکنند تا شرح جامعی از پیشپردازش دادهها، چراییها و چگونگیهای آن به دست آورید و فرصتهایی را شناسایی کنید که تجزیه و تحلیل دادهها میتواند منجر به تصمیمگیری مؤثرتر شود. با پیشرفت در فصلها، نقش سیستمها و فنآوریهای مدیریت داده برای تجزیه و تحلیل مؤثر و نحوه استفاده از APIها برای جمعآوری دادهها را نیز درک خواهید کرد.
تا پایان این کتاب پیشپردازش دادههای پایتون، میتوانید از پایتون برای خواندن، دستکاری و تجزیه و تحلیل دادهها استفاده کنید. تکنیکهای پاکسازی، یکپارچهسازی، کاهش و تبدیل دادهها را انجام دهید و مقادیر پرت یا از دست رفته را مدیریت کنید تا به طور مؤثر دادهها را برای ابزارهای تحلیلی آماده کنید.
آنچه خواهید آموخت
- از پایتون برای انجام توابع تحلیلی روی داده های خود استفاده کنید
- نقش پایگاه های داده و نحوه استخراج موثر داده ها از پایگاه های داده را درک کنید
- مراحل پیش پردازش داده را که با اهداف تجزیه و تحلیل شما تعریف شده است انجام دهید
- چالش های یکپارچه سازی داده ها را بشناسید و حل کنید
- نیاز به کاهش داده را شناسایی کرده و آن را اجرا کنید
- شناسایی فرصت ها برای بهبود تجزیه و تحلیل با تبدیل داده ها
این کتاب برای چه کسی است
این کتاب برای تحلیلگران داده های جوان و ارشد، متخصصان هوش تجاری، دانشجویان کارشناسی مهندسی و علاقه مندان به داده است که به دنبال انجام پیش پردازش و پاکسازی داده ها در مقادیر زیادی از داده ها هستند. برای شروع کار با این کتاب نیازی به تجربه قبلی در زمینه پیش پردازش داده ندارید. با این حال، مهارت های برنامه نویسی اولیه، مانند کار با متغیرها، شرطی ها و حلقه ها، همراه با دانش سطح مبتدی از پایتون و تجربه ساده تجزیه و تحلیل، پیش نیاز است.
فهرست مطالب
- بررسی ماژول های اصلی NumPy و Pandas
- بررسی یک ماژول اصلی دیگر - Matplotlib
- داده - واقعاً چیست؟
- پایگاه های داده
- تجسم داده ها
- پیش بینی
- طبقه بندی
- تجزیه و تحلیل خوشه بندی
- تمیز کردن داده ها سطح I - تمیز کردن جدول
- سطح دوم پاکسازی داده ها - باز کردن بسته بندی، بازسازی و فرمول بندی مجدد جدول
- پاکسازی داده ها سطح III- مقادیر از دست رفته، نقاط دورافتاده و خطاها
- ترکیب داده ها و یکپارچه سازی داده ها
- کاهش داده ها
- تبدیل داده و ماساژ
- مطالعه موردی 1 - سلامت روان در فناوری
- مطالعه موردی 2 - پیش بینی بستری شدن در بیمارستان COVID-19
- مطالعه موردی 3: تجزیه و تحلیل خوشه بندی شهرستان های ایالات متحده
- خلاصه، تمرین مطالعات موردی، و نتیجه گیری
ارسال نظر درباره کتاب Hands-On Data Preprocessing in Python: Learn how to effectively prepare data for successful data analytics